هوش فیزیکی: پیشگامان مغزهای رباتیک در سیلیکون ولی

از خیابان، تنها نشانهای که میتوان فهمید دفتر مرکزی Physical Intelligence در سانفرانسیسکو قرار دارد، یک نماد پی است که رنگ آن اندکی با رنگ بقیه در متفاوت است. وقتی وارد ساختمان میشوم، بلافاصله با جنب و جوش زیادی روبرو میشوم. نه میز پذیرشی وجود دارد و نه لوگویی که با نورهای درخشان نصب شده باشد.
درون ساختمان، فضا جعبهای بزرگ از بتن است که تنها با چیدمان نامنظم چندین میز چوبی بلند، از حالت خشونتآمیز خارج شده است. بعضی میزها مشخصاً برای ناهار تعبیه شدهاند و با جعبههای شیرینی Girl Scout، شیشههای وگیمایت (واضح است که کسی اینجا استرالیایی است) و سبدهای کوچک سیمی پر از ادویهجات زیاد، تزئین شدهاند. بقیه میزها اما داستان دیگری دارند. اکثر آنها پر از مانیتور، قطعات یدکی رباتیک، سیمهای سیاه درهم تنیده و بازوهای رباتیکیاند که در شرایط مختلف، تلاش میکنند بر امور روزمره مسلط شوند.
در زمان بازدید من، یکی از این بازوها مشغول تا کردن یک شلوار مشکی است، یا بهتر بگویم، سعی میکند این کار را انجام دهد و چندان موفق نیست. بازوی دیگری تلاش میکند تیشرتی را به داخل برگرداند و مصمم است بالاخره این کار را انجام دهد، هرچند امروز نه. بازوی سوم که گویا کار مورد علاقهاش را پیدا کرده، با سرعت پوست یک کدو سبز را میگیرد تا برشها را در ظرف جداگانهای بریزد. حداقل این بخش خوب پیش میرود.
سرگئی لوین، یکی از بنیانگذاران Physical Intelligence و استاد دانشگاه UC Berkeley با اشاره به این حرکات هماهنگ، توضیح میدهد: «این را مثل ChatGPT تصور کنید، اما برای رباتها.» لوین با چهرهای مهربان و عینک به چشم، از آن افرادی است که زمان زیادی را صرف توضیح مفاهیم پیچیده به افراد غیرمتخصص کرده است.

آنچه من تماشا میکنم، به گفته او، مرحله آزمایش یک چرخه پیوسته است: دادهها در ایستگاههای روباتیکی اینجا و در مکانهای دیگر—از انبارها گرفته تا خانهها و هرجایی که تیم بتواند آن را راهاندازی کند—جمعآوری میشوند و این دادهها مدلهای بنیادی عمومی رباتیک را آموزش میدهند. وقتی پژوهشگران مدلی را آموزش میدهند، آن مدل برای ارزیابی به ایستگاههایی مانند اینجا بازمیگردد. شلوار تاکن یک آزمایش است، تیشرت برگردان هم همینطور. کدوپوستکن هم شاید در حال بررسی این است که آیا مدل میتواند دانشش را به سبزیجات دیگر هم تعمیم دهد، تا مهارت در پوست کندن را برای سیب یا سیبزمینی که قبلاً با آن مواجه نشده، یاد بگیرد.
شرکت در همین ساختمان و مکانهای دیگر آشپزخانه آزمون دارد و با سختافزارهای آماده بازار، رباتها را در معرض محیطها و چالشهای متنوع قرار میدهد. کنار دست یک دستگاه اسپرسوساز پیشرفته قرار دارد که تصور میکنم برای کارمندان باشد، اما لوین توضیح میدهد نه، این دستگاه برای آموزش رباتها تهیه شده است. هر لاته کفکردهای داده است، نه مزیتی برای مهندسان متعدد حاضر در محل که یا مشغول کار با رایانههای خود هستند یا پای آزمایشهای مکانیکی.
خود سختافزار عمداً ظاهر سادهای دارد. این بازوها با قیمتی حدود ۳۵۰۰ دلار عرضه میشوند، آن هم با اضافه بهای زیاد از سوی فروشنده. لوین میگوید اگر در داخل شرکت ساخته شوند، هزینه مواد اولیه آنها کمتر از ۱۰۰۰ دلار خواهد بود. تا چند سال پیش، یک متخصص رباتیک تعجب میکرد که اصلاً چنین دستگاهی بتواند کاری انجام دهد. اما اصل قضیه همین است—هوش خوب کمبود سختافزار را جبران میکند.
لوین که برای کاری دیگر میرود، لاچی گرووم به سمت من میآید؛ او با انرژی و هدفمندی حرکت میکند، انگار همزمان مشغول به چندین کار است. گرووم، که حالا ۳۱ سال دارد، هنوز روحیه جوان نابغههای دره سیلیکون را حفظ کرده است. این شهرت را خیلی زود به دست آورد، وقتی در ۱۳ سالگی نخستین شرکت خود را در استرالیا فقط نه ماه پس از راهاندازی فروخت (که توضیحدهنده حضور وگیمایت هم هست).
اولین بار که به او نزدیک شدم، زمانی بود که او تعداد کمی بازدیدکننده با لباسهای ورزشی را به ساختمان دعوت میکرد. در پاسخ به درخواستم برای گفتگو، فوراً گفت: «اصلاً نمیشود، جلسه دارم.» حالا شاید ده دقیقه وقت پیدا کرده است.
گرووم زمانی که کارهای دانشگاهی منتشر شده از آزمایشگاههای لوین و چلسی فین، دانشآموخته دکترای لوین که اکنون در استنفورد روی یادگیری رباتیک کار میکند، دنبال کرد، هدفش را یافت. نام آنها مرتباً در هر پروژه جالبی در حوزه رباتیک دیده میشد. وقتی شنید ممکن است آنها بخواهند کاری جدید شروع کنند، به دنبال کارول هاوسمن رفت؛ پژوهشگری از Google DeepMind که تدریس هم میکرد و گرووم فهمیده بود او هم در تیم حضور دارد. به گفته خودش: «از آن جلسههایی بود که بیرون آمدی و فکر کردی: همین است.»
گرووم میگوید قصد نداشت به یک سرمایهگذار تماموقت تبدیل شود، هرچند با توجه به سوابقش، شاید بعضیها توقع داشتند چنین کند. پس از ترک Stripe، که در آن شرکت از کارمندان اولیه بود، تقریباً پنج سال به عنوان سرمایهگذار فرشته فعالیت کرد و روی شرکتهایی مانند Figma، Notion، Ramp و Lattice مبلغ اندکی سرمایهگذاری کرد در حالی که به دنبال شرکت مناسب برای راهاندازی یا پیوستن به آن بود. نخستین سرمایهگذاری او در زمینه رباتیک، شرکت Standard Bots در سال ۲۰۲۱ بود که دوباره او را به حوزهای بازگرداند که از کودکی و هنگام ساختن Lego Mindstorms به آن علاقه داشت. طنز ماجرا این است که به شوخی خودش، «به عنوان سرمایهگذار خیلی بیشتر در تعطیلات بودم». اما سرمایهگذاری فقط راهی برای فعال بودن و گسترش ارتباطات بود، نه هدف نهایی. «پنج سال دنبال شرکتی بودم که بعد از استرایپ بروم راه بیندازم. ایده خوب در زمان خوب با تیم خوب—اینها واقعاً نادر است. همه چیز به اجرا وابسته است، اما اگر روی ایده بد هم قوی اجرا کنی، باز هم ایده بد باقی میماند.»

این شرکت که فقط دو سال از تأسیس آن میگذرد، اکنون بیش از ۱ میلیارد دلار سرمایه جذب کرده است و وقتی درباره میزان بودجهاش پرسیدم، فوری توضیح داد که در واقع این شرکت آنقدرها خرج نمیکند. بیشتر هزینهها صرف محاسبات میشود. بلافاصله بعد گفت که در شرایط مناسب و با شرکای درست، حاضر است سرمایه بیشتری جذب کند. «هیچ محدودیتی برای اینکه چقدر میتوانیم صرف کار کنیم وجود ندارد. همیشه میشود ظرفیت محاسباتی بیشتری به مسئله اضافه کرد.»
آنچه این رویکرد را خاص میکند، این است که گرووم هیچ موعد زمانی برای درآمدزایی شرکت به سرمایهگذارانش نمیدهد. او درباره حامیانی مانند Khosla Ventures، Sequoia Capital و Thrive Capital — که ارزش شرکت را ۵.۶ میلیارد دلار تخمین زدهاند — میگوید: «من به سرمایهگذاران درباره تجاریسازی جواب نمیدهم.» به گفته او، این موضوع غیرعادی است که افراد این شرایط را میپذیرند. البته آنها همیشه این رویکرد را نمیپذیرند، به همین دلیل است که بهتر است شرکت اکنون به خوبی تأمین مالی شود.
استراتژی این شرکت، اگر نه تجاریسازی، چیست؟ کوان ووآنگ، یکی دیگر از بنیانگذاران که از Google DeepMind آمده، توضیح میدهد که مجموعه بر یادگیری میانبدنی و منابع داده متنوع تکیه دارد. اگر فردا کسی یک پلتفرم سختافزاری جدید بسازد، نیازی به شروع جمعآوری داده از صفر نیست—میتواند تمام دانشی که مدل دارد را منتقل کند. به گفته او، «هزینه نهایی اضافه کردن خودمختاری به یک پلتفرم رباتیک جدید، هرچه که باشد، بسیار کمتر خواهد بود.»
شرکت در حال حاضر با چند شرکت در حوزههای مختلف مانند لجستیک، خردهفروشی مواد غذایی و یک کارخانه شکلاتسازی در آن سوی خیابان همکاری میکند تا ببیند آیا سیستمهایشان برای اتوماسیون واقعی کافی هستند یا نه. ووآنگ ادعا میکند که در مواردی پاسخ مثبت است. با رویکرد «هر پلتفرم، هر وظیفه»، دامنه موفقیت به اندازهای وسیع است که میتوان برخی کارها را همین امروز به طور کامل اتوماتیک کرد.
Physical Intelligence تنها شرکتی نیست که چنین چشماندازی دارد. رقابت برای ساخت هوش رباتیک همهمنظوره—که پایهای برای ساخت کاربردهای تخصصیتر مثل مدلهای زبانی سه سال پیش خواهد بود—شدت گرفته است. شرکت Skild AI مستقر در پیتسبرگ که در سال ۱۴۰۲ تأسیس شده است، به تازگی یک میلیارد و ۴۰۰ میلیون دلار جذب سرمایه داشته و رویه کاملاً متفاوتی پیش گرفته است. در حالی که Physical Intelligence بر پژوهش محض تمرکز دارد، Skild AI مدل همهبدنی خود با نام Skild Brain را از همین حالا بهطور تجاری پیادهسازی کرده و میگوید فقط پارسال و در چند ماه، ۳۰ میلیون دلار درآمد داشته است—آن هم در حوزه امنیت، انبارها و تولید.

شرکت Skild حتی رقبا را به صورت عمومی نقد کرده و در وبلاگ خود نوشته است که بیشتر «مدلهای بنیادی رباتیک» در حقیقت همان مدلهای بینایی-زبانی هستند «در پوششی متفاوت» که فاقد «حس مشترک فیزیکی واقعی» هستند، چرا که بیش از حد به آموزشهای اینترنتی وابستهاند و به شبیهسازی فیزیکی و دادههای واقعی رباتیک تکیه ندارند.
این اختلاف دیدگاه عمیقی است. Skild AI معتقد است اجرای تجاری مدلها، گردش دادهای ایجاد میکند که مدل را با هر کاربرد واقعی بهتر میکند. Physical Intelligence بر این باور است که مقاومت در برابر وسوسه تجاریسازی سریع، زمینه تولید هوش عمومی برتر را فراهم میآورد. اینکه کدام درستتر است، سالها زمان میبرد تا مشخص شود.
در این میان، Physical Intelligence با شفافیتی که گرووم آن را غیرمعمول توصیف میکند فعالیت دارد. «این شرکت خیلی ناب است. یک پژوهشگر نیازی دارد، ما داده جمع میکنیم برایش—یا سختافزار یا هر چه باشد—و بعد انجام میدهیم. چیزی از بیرون به ما دیکته نمیشود.» او میگوید شرکت نقشهای ۵ تا ۱۰ ساله از آنچه تصور میکردند ممکن است داشت و ظرف ۱۸ ماه از آن کاملاً عبور کردند.
شرکت حدود ۸۰ نفر نیروی کار دارد و قصد دارد رشد کند، هرچند گرووم امیدوار است «تا حد ممکن آهسته» این رشد اتفاق بیفتد. بزرگترین چالش، به گفته او، سختافزار است. «سختافزار واقعاً دشوار است. هر کاری که ما انجام میدهیم چندین برابر شرکت نرمافزاری چالش دارد.» سختافزار خراب میشود، آهسته میرسد و تستها را عقب میاندازد. ملاحظات ایمنی هم همه چیز را پیچیدهتر میکند.
وقتی گرووم با عجله به سراغ تعهد بعدی خود میرود، من با تماشای تلاش رباتها باقی میمانم: شلوار همچنان درست تا نشده، تیشرت همانطور درست بیرون مانده و تراشههای کدو به خوبی جمع شدهاند.
سوالات زیادی وجود دارد، از جمله اینکه آیا واقعاً کسی میخواهد رباتی در آشپزخانهاش سبزیجات پوست بکند؟ یا نگرانیهای ایمنی، یا اینکه آیا حضور ربات باعث نگرانی حیوان خانگی در خانه میشود، و اینکه این همه وقت و سرمایه صرف شده واقعاً مشکلات بزرگی را حل میکند یا مشکلات جدیدی به وجود میآورد. از طرفی، بیرونیها پیشرفت شرکت را زیر سوال میبرند، اینکه آیا چشمانداز قابل دستیابی است، و آیا تمرکز بر هوش عمومی به جای راهکارهای تخصصی منطقی است یا نه.
اگر گرووم تردیدی داشته باشد، آن را نشان نمیدهد. او با افرادی کار میکند که دهههاست روی این مسئله کار میکنند و باور دارند سرانجام زمانش فرا رسیده است، و همین برایش کافیست.
در ضمن، سیلیکونولی از اول به افرادی مانند گرووم فرصت داده تا آنها مسیرشان را پیدا کنند، حتی اگر برنامه تجاری مشخص یا موعد زمانی روشن نداشته باشند یا ندانند بازار در زمان دستیابی به هدف به چه شکل خواهد بود. همیشه موفق نمیشوند اما آنجاهایی که موفق میشود، بسیاری از شکستهای دیگر را جبران میکند.



